连续空间中有效有效的探索是将加固学习(RL)应用于自主驾驶的核心问题。从专家演示或为特定任务设计的技能可以使探索受益,但是它们通常是昂贵的,不平衡/次优的,或者未能转移到各种任务中。但是,人类驾驶员可以通过在整个技能空间中进行高效和结构性探索而不是具有特定于任务的技能的有限空间来适应各种驾驶任务。受上述事实的启发,我们提出了一种RL算法,以探索所有可行的运动技能,而不是一组有限的特定于任务和以对象为中心的技能。没有演示,我们的方法仍然可以在各种任务中表现出色。首先,我们以纯粹的运动角度构建了一个任务不合时宜的和以自我为中心的(TAEC)运动技能库,该运动技能库是足够多样化的,可以在不同的复杂任务中重复使用。然后,将运动技能编码为低维的潜在技能空间,其中RL可以有效地进行探索。在各种具有挑战性的驾驶场景中的验证表明,我们提出的方法TAEC-RL在学习效率和任务绩效方面的表现显着优于其同行。
translated by 谷歌翻译
激光射道是激光雷达同时定位和映射(SLAM)的重要部分之一。但是,现有的LiDAR探光法倾向于将新的扫描与以前的固定置扫描相匹配,并逐渐累积错误。此外,作为一种有效的关节优化机制,由于大规模全球地标的密集计算,捆绑捆绑调整(BA)不能直接引入实时探光仪。因此,这封信设计了一种新策略,称为LINDAR SLAM中的捆绑调节探针仪(LMBAO)的具有里程碑意义的地图,以解决这些问题。首先,通过主动地标维护策略进一步开发了基于BA的进程法,以进行更准确的本地注册并避免累积错误。具体来说,本文将整个稳定地标在地图上保存,而不仅仅是在滑动窗口中的特征点,并根据其主动等级删除地标。接下来,减小滑动窗口长度,并执行边缘化以保留窗口外的扫描,但对应于地图上的活动地标,从而大大简化了计算并改善了实时属性。此外,在三个具有挑战性的数据集上进行的实验表明,我们的算法在户外驾驶中实现了实时性能,并且超过了最先进的激光雷达大满贯算法,包括乐高乐园和VLOM。
translated by 谷歌翻译
玻璃在现实世界中非常普遍。受玻璃区域的不确定性以及玻璃背后的各种复杂场景的影响,玻璃的存在对许多计算机视觉任务构成了严重的挑战,从而使玻璃分割成为重要的计算机视觉任务。玻璃没有自己的视觉外观,而只能传输/反映其周围环境的外观,从而与其他常见对象根本不同。为了解决此类具有挑战性的任务,现有方法通常会探索并结合深网络中不同特征级别的有用线索。由于存在级别不同的特征之间的特征差距,即,深层特征嵌入了更多高级语义,并且更好地定位目标对象,而浅层特征具有更大的空间尺寸,并保持更丰富,更详细的低级信息,因此,将这些特征融合到天真的融合将导致亚最佳溶液。在本文中,我们将有效的特征融合到两个步骤中,以朝着精确的玻璃分割。首先,我们试图通过开发可区分性增强(DE)模块来弥合不同级别特征之间的特征差距,该模块使特定于级别的特征成为更具歧视性的表示,从而减轻了融合不兼容的特征。其次,我们设计了一个基于焦点和探索的融合(FEBF)模块,以通过突出显示常见并探索级别差异特征之间的差异,从而在融合过程中丰富挖掘有用的信息。
translated by 谷歌翻译
没有人类在真空中开车。她/他必须与其他道路使用者进行谈判,以在社交交通场景中实现目标。理性的人类驾驶员可以通过隐式通信以社交兼容的方式与其他道路使用者进行互动,以便在互动密集型,关键的安全环境中平稳地完成其驾驶任务。本文旨在审查现有的方法和理论,以帮助理解和重新考虑人类驱动因素与社会自主驾驶之间的互动。我们进行此调查以寻求一系列基本问题的答案:1)道路交通场景中的社交互动是什么? 2)如何衡量和评估社会互动? 3)如何建模和揭示社会互动的过程? 4)人类驾驶员如何达成隐性协议并在社交互动方面平稳地谈判?本文回顾了建模和学习人类驱动因素之间的社会互动的各种方法,从优化理论和图形模型到社会力量理论以及行为和认知科学。我们还重点介绍了一些新的方向,关键挑战和未来研究的开头问题。
translated by 谷歌翻译
由于安全问题,自动驾驶汽车的大规模部署已不断延迟。一方面,全面的场景理解是必不可少的,缺乏这种理解会导致易受罕见但复杂的交通状况,例如突然出现未知物体。但是,从全球环境中的推理需要访问多种类型的传感器以及多模式传感器信号的足够融合,这很难实现。另一方面,学习模型中缺乏可解释性也会因无法验证的故障原因阻碍安全性。在本文中,我们提出了一个安全增强的自主驾驶框架,称为可解释的传感器融合变压器(Interfuser),以完全处理和融合来自多模式多视图传感器的信息,以实现全面的场景理解和对抗性事件检测。此外,我们的框架是从我们的框架中生成的中间解释功能,该功能提供了更多的语义,并被利用以更好地约束操作以在安全集内。我们在Carla基准测试中进行了广泛的实验,我们的模型优于先前的方法,在公共卡拉排行榜上排名第一。
translated by 谷歌翻译
在与其他代理商的社交互动下进行计划是自动驾驶的重要问题。随着自动驾驶汽车在相互作用中的作用会影响,并且也受到其他试剂的影响,因此自动驾驶汽车需要有效地推断其他试剂的反应。大多数现有方法将问题提出为广泛的NASH平衡问题,该问题通过基于优化的方法解决。但是,他们要求过多的计算资源,并且由于非凸度而容易落入本地最低限度。蒙特卡洛树搜索(MCTS)成功解决了游戏理论问题中的此类问题。但是,随着交互游戏树的成倍增长,一般的MCT仍然需要大量迭代才能达到Optima。在本文中,我们通过将预测算法作为启发式算法纳入了基于一般MCT的高效游戏理论轨迹计划算法。最重要的是,符合社会的奖励和贝叶斯推理算法旨在产生多样化的驾驶行为并确定其他驾驶员的驾驶偏好。结果证明了在高度交互式场景中包含自然主义驾驶行为的数据集的提议框架的有效性。
translated by 谷歌翻译
人类司机的高保真行为预测对于自治车辆的高效和安全部署是至关重要的,这是由于人为行为的随机性,异质性和时变性而挑战。一方面,训练有素的预测模型只能在平均意义上捕获运动模式,而个体之间的细微差异几乎不能被反映。另一方面,在训练集上训练的预测模型可能不会概括到可能处于不同场景或数据分布的测试集,从而导致可转换性和概括性。在本文中,我们应用了$ \ tau $ -step修改的扩展卡尔曼滤波器参数适应算法(MEKF $ _lambda $)到驾驶行为预测任务,尚未在文学中进行过研究。通过观察到的轨迹的反馈,该算法应用于基于神经网络的模型,以改善不同人类对象和场景的驾驶行为预测的性能。提出了一组新的指标,以系统评估在线适应性能降低不同个人和场景的预测误差。还提供了对模型中最佳层的实证研究及其观察步骤。
translated by 谷歌翻译
当自治车辆仍然努力解决在路上驾驶期间解决具有挑战性的情况时,人类长期以来一直掌握具有高效可转移和适应性的驱动能力的推动的本质。通过在驾驶期间模仿人的认知模型和语义理解,我们呈现帽子,一个分层框架,在多助手密集交通环境中产生高质量的驾驶行为。我们的方法层次地由高级意图识别和低级动作生成策略组成。通过语义子任务定义和通用状态表示,分层框架可在不同的驱动方案上传输。此外,我们的模型还能够通过在线适应模块捕获个人和场景之间的驾驶行为的变化。我们展示了在交叉路口和环形交叉路口的真实交通数据的轨迹预测任务中的算法,我们对该提出的方法进行了广泛的研究,并证明了我们的方法在预测准确性和可转移性方面的方式表现出其他方法。
translated by 谷歌翻译
随着越来越多的自主车辆(AVS)正在公共道路上部署,为他们设计的社会兼容行为变得越来越重要。为了产生安全和有效的行动,AVS不仅需要预测其他交通参与者的未来行为,而且需要意识到与这种行为预测相关的不确定性。在本文中,我们提出了一个不确定的综合预测和规划(UAPP)框架。它允许AVS推断在线其他道路用户的特征,并不仅可以为自己的奖励提供优化的行为,也可以对他人提供礼貌,以及他们对预测不确定性的信心。我们首先提出了礼貌和信心的定义。基于此,探讨了对互动驾驶场景中AVS行为的影响。此外,我们通过将产生的行为与地面真理进行比较来评估自然主义人类驾驶数据的提议算法。结果表明,在线推断可以显着提高所产生行为的人类肖像。此外,我们发现人类的司机对他人表示非常适合那些没有权利的人。我们还发现,这种驾驶偏好在不同的文化中有所不同。
translated by 谷歌翻译
Agile robotics presents a difficult challenge with robots moving at high speeds requiring precise and low-latency sensing and control. Creating agile motion that accomplishes the task at hand while being safe to execute is a key requirement for agile robots to gain human trust. This requires designing new approaches that are flexible and maintain knowledge over world constraints. In this paper, we consider the problem of building a flexible and adaptive controller for a challenging agile mobile manipulation task of hitting ground strokes on a wheelchair tennis robot. We propose and evaluate an extension to work done on learning striking behaviors using a probabilistic movement primitive (ProMP) framework by (1) demonstrating the safe execution of learned primitives on an agile mobile manipulator setup, and (2) proposing an online primitive refinement procedure that utilizes evaluative feedback from humans on the executed trajectories.
translated by 谷歌翻译